فناوری

AMD Instinct MI300X برای اولین بار در بنچمارک های هوش مصنوعی MLPerf v4.1، آزمایش شده با پردازنده های نسل بعدی EPYC Turin “Zen 5” ظاهر شد.

AMD Instinct MI300X برای اولین بار در بنچمارک های هوش مصنوعی MLPerf v4.1، آزمایش شده با پردازنده های نسل بعدی EPYC Turin “Zen 5” ظاهر شد.

شتاب‌دهنده‌های هوش مصنوعی Instinct MI300X AMD اولین حضور در MLPerf نسخه 4.1 و با CPUهای نسل بعدی EPYC “Turin”.

AMD Instinct MI300X و EPYC Turin “Zen 5” اولین بار در MLPerf V4.1، اولین نگاه به عملکرد Llama 2 در دنیای واقعی

امروز، AMD اولین معیارهای عملکرد آخرین مرکز داده و سخت افزار مبتنی بر هوش مصنوعی خود را در MLPerf Inference v4.1 به اشتراک می گذارد. این حجم‌های کاری برای نمایش پتانسیل سخت‌افزارهای جدید و آینده غول‌های فناوری مختلف مانند AMD، Intel و NVIDIA طراحی شده‌اند.

تیم قرمز اولین ارسال‌های خود را از شتاب دهنده Instinct MI300X در MLPerf از زمان معرفی تراشه در حالی که طعم پردازنده های آتی EPYC Turin که نسل پنجم هستند را نیز به ما می دهد. ردیف سرور بر اساس معماری هسته Zen 5.

I شکل>

در مقایسه با NVIDIA H100، Instinct MI300X در عملکرد سرور کمی کندتر است در حالی که تفاوت در سناریوی آفلاین بیشتر می شود. پیکربندی تورین در سناریوی سرور 2 درصد سریعتر به پایان می رسد اما در سناریوی آفلاین عقب می ماند. به نظر می رسد این نتایج با نتایجی مطابقت دارد که NVIDIA در اعلامیه خود منتشر کرده است. AMD همچنین مقیاس تقریباً عالی را در Llama2-70B با استفاده از مقایسه 1 GPU و 8 GPU به نمایش گذاشته است.

منبع تصویر: AMD

در آخر، AMD مزیت حافظه ارائه شده توسط شتاب دهنده های هوش مصنوعی Instinct MI300X خود را برجسته می کند که بسیار بیشتر از آنچه در پلت فرم NVIDIA H100 ارائه شده است. MI300X حافظه کافی برای برآوردن نیازهای بزرگترین مدل های زبان در انواع فرمت های داده ارائه می دهد.

ما هیجان‌زده هستیم که همچنان تطبیق‌پذیری و عملکرد شتاب‌دهنده‌های AMD Instinct را در معیارهای آینده به نمایش بگذاریم، زیرا تلاش‌های تست و بهینه‌سازی خود را گسترش می‌دهیم. این تازه شروع سفر ماست. در ماه‌های آینده، ما قصد داریم نسخه‌های بعدی سری AMD Instinct را عرضه کنیم که از جمله پیشرفت‌های دیگر، حافظه اضافی، پشتیبانی از انواع داده‌های با دقت کمتر و افزایش قدرت محاسباتی است. ROCm آینده، بهبودهای نرم افزاری هدف را منتشر می کند، از جمله بهبودهای هسته و پشتیبانی پیشرفته کوانتیزاسیون. منتظر ارسال بعدی MLPerf ما باشید — ما مشتاقانه منتظر به اشتراک گذاشتن پیشرفت و اطلاعات خود با شما هستیم.

از طریق AMD

AMD در اینجا انجام نشده است زیرا قصد دارد پشته ROCm خود را با بهینه‌سازی‌های بیشتر نسبت به هوش مصنوعی مستحکم کند تا بتوانیم در تکرار بعدی ارسال‌های MLPerf شاهد به‌روزرسانی‌های عملکرد باشیم. در حالی که AMD برای ارسال شماره‌های MI300X زمان زیادی صرف کرد، می‌توان امیدوار بود که MI325X، که در سه ماهه آینده عرضه می شود، نتایج بسیار زودتر ارائه خواهد شد، زیرا یک نسخه اصلی است محصولی که 50 درصد ظرفیت را نسبت به MI300X افزایش می دهد. همچنین انتظار می‌رود پردازنده AMD EPYC Turin “Zen 5” در اواخر سال جاری عرضه شود، پس با ما همراه باشید.

این داستان را به اشتراک بگذارید

< استفاده از xlink:href="#icn-shareFacebook"/> فیس بوک

< استفاده از xlink:href="#icn-shareTwitter"/> توییتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا